iT邦幫忙

2023 iThome 鐵人賽

DAY 5
0
自我挑戰組

python-資料分析與機器學習系列 第 5

DAY5-資料分析的工具:pandas(Series)

  • 分享至 

  • xImage
  •  

前言

學過了numpy之後,接下來看看pandas的用法吧。在pandas中,提供了一些讀取不同檔案的方法。


讀取檔案的方法

import pandas as pd      #載入pandas套件,縮寫為pd

pd.read_cvs('a.csv')     #讀取csv檔
pd.read_json('a.json')   #讀取json檔
pd.read_html('url')      #讀取網頁
pd.read_excel('a.xlsx')  #讀取xlsx檔

Series:建立索引的一為串列,通常用來處理時間序列相關的資料。

以下介紹一些有關series的用法

>>> import pandas as pd
>>> a = pd.Series([1,2,3])
>>> print(a)
0    1
1    2
2    3
dtype: int64

利用values顯示series中的元素

>>> a.values  
array([1, 2, 3])

利用index顯示series中的元素

>>> a.index                         
RangeIndex(start=0, stop=3, step=1) #Series是從0開始到4結束,每個資料間隔為1

利用索引顯示元素

>>> a[1] 
2

透過Series將TP字典的Key轉為index序列

>>> TP={"100":"中正區","103":"大同區","104":"中山區","105":"松山區","106":"大安區","108":"萬華區","110":"信義區","111":"士林區","112":"北投區","114":"內湖區","115":"南港區","116":"文山區"}
>>> pd.Series(TP)
100    中正區
103    大同區
104    中山區
105    松山區
106    大安區
108    萬華區
110    信義區
111    士林區
112    北投區
114    內湖區
115    南港區
116    文山區
dtype: object

今天學完pandas中Series的用法,明天再繼續學pandas中的DataFrame吧!

---20230920---


上一篇
DAY4-資料分析的工具:numpy(練習)
下一篇
DAY6-資料分析的工具:pandas(DataFrame)
系列文
python-資料分析與機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言